查看原文
其他

专家说:基于DPU智能网卡的云原生方案,如何提升网络云水平?

移动Labs 移动Labs 2024-01-11



导语

在2023年中国云网智联大会上,中国通信标准化协会 TC610 SDN/NFV/AI标准与产业推进委员会颁布了“2022年度SDN、NFV、网络AI优秀案例”的获奖案例,中国移动申报的“中国移动DPU智能网卡在NFV云原生场景的商用实践”项目在众多案例中脱颖而出,荣获“最佳实践案例奖”。本期移动Labs邀请了中国移动研究院网络与IT技术研究所研究员班有容,与大家分享DPU领域发展情况,以及基于DPU智能网卡的电信级云原生解决方案等。


Q & A time starts!


01移动Labs

DPU作为全新赛道正处于快速发展时期,众多企业进入这一赛道并在积极进行产品研发与落地探索。请您介绍一下,中国移动面向DPU领域进行了哪些布局和探索?

班有容

DPU目前处于快速发展时期,无论是DPU厂商还是云厂商都在各自进行技术探索和产品研发,形成了技术路线各自为营、DPU软硬件服务器定向适配的商业模式,技术体系不完善、产业生态不健全是DPU行业发展面临的核心挑战。


为此,中国移动从总体架构、关键技术、标准开源、产业生态多个方面对DPU进行了体系化攻关,对标准体系和生态合作进行了全面布局。首先,行成DPU软硬解耦“1+5+4”技术标准体系,在《中国移动DPU技术白皮书》中,阐明了一套架构、软件五大功能、硬件四个统一的三大标准化方向。依托国内外标准开源组织,如CCSA、OIF CFN开源社区,构建DPU标准体系、探索DPU卸载方案的开源实现。其次,成立DPU创新开放实验室,锚定业务场景孵化器、技术方案实验床、产业聚合平台三大定位,引导业界产品成熟落地。


02移动Labs

近期,“中国移动DPU智能网卡在NFV云原生场景的商用实践”项目荣获SNAI推委会2022年度最佳实践案例奖。请您介绍一下,该实践项目的背景和实践意义?

班有容

中国移动自2018年以来,基于NFV/SDN技术构建了全球规模最大的网络云,总建设规模超13万台,支撑43类网元上云,云化比例超过80%。随着网络云商用规模扩大,运维管理效率、资源利用率与平台敏捷性较低等一系列痛点问题凸显,容器技术为核心的云原生技术路线成为演进方向。而电信级的管理模式以及高安全、高可靠、高性能要求,需要对传统架构下的云原生方案进行进一步优化升级。


为此,该项目创新提出了基于容器技术和DPU技术的端到端电信级云原生解决方案,通过试点和商用上线,促进了DPU、容器平台、编排管理等各领域标准、技术、产品成熟,为信息通信产业繁荣发展注入新动力。同时,验证了基于DPU的容器化技术路线作为运营商网络演进方向的可行性,开辟了运营商网络向云原生演进的新道路,成为运营商网络向云原生转型的最佳实践。


03移动Labs

作为DPU在NFV领域的首例创新实践,基于DPU智能网卡的电信级云原生解决方案解决了哪些痛点问题?

班有容

针对网络云运维管理效率、资源利用率与平台敏捷性较低等一系列痛点问题,引入云原生技术成为演进方向。网络云电信级的管理模式以及高安全、高可靠、高性能要求,需要对传统架构下的云原生方案进行进一步优化升级,具体包括:


➣ 容器管理编排能力需增强:基于Kubernetes的容器层主要负责容器化应用的编排管理,但在生产环境中需要交付多节点的容器集群供容器化应用运行,现有系统架构中缺乏电信级容器集群编排管理能力;裸机容器发放流程冗长,影响裸机容器集群的快速部署;CT业务存在不同于IT业务的多逻辑网络平面(如管理网络、内部通信网络、外部服务网络等)编排需求。


➣ 网络存在性能瓶颈:单台服务器上可部署的容器数量远大于虚拟机数量,同时电信网络存在面向连接的应用特性及网元内部虚机全互连的设计,对单节点网络转发流表数和性能等提出了更高要求。


➣ 裸机场景存在安全风险:在裸机容器场景下,共享存储的网络协议栈暴露在租户操作系统中,通过租户操作系统可恶意占用存储网络带宽和连接数,影响其他用户对存储网络的访问。


以此为背景,基于DPU智能网卡的云原生技术方案对云原生技术的管理编排能力、网络性能、裸机安全等进行电信级增强,形成端到端电信级云原生解决方案,支撑云原生在运营商网络的商用落地。


04移动Labs

基于DPU智能网卡的电信级云原生解决方案具体技术方案是什么?

班有容

基于DPU智能网卡的端到端电信级云原生解决方案以“三层一域”为基础,在硬件层引入DPU智能网卡,卸载管理、网络、存储等虚拟化任务,配合虚拟层实现裸金属弹性发放、虚拟网络加速以及存储网络安全。新增容器层,包括容器集群管理CCM,容器基础设施管理器CIM和容器基础设施引擎CIE。CCM提供容器集群生命周期管理能力,CIM提供容器应用、容器网络、容器存储的生命周期管理能力,CIE提供容器运行环境,具备按CIM指令运行容器管理操作的能力。MANO新增电信级基于DPU智能网卡的容器集群、容器应用编排管理方案和运维管理方案,统一容器层北向运维接口,标准化容器应用包格式和流程。


基于NFV标准“三层一域”架构增强


05移动Labs

该解决方案为解决痛点问题,对硬件层、容器层、MANO等实现了哪些电信级增强?

班有容

硬件层引入DPU智能网卡,制定弹性裸金属发放流程和卸载方案,实现云化裸金属的弹性发放,解决裸金属存储安全性问题;对vSwitch卸载接口进行电信级增强,提升网络转发能力;vSwitch控制面与转发面标准化解耦,降低DPU和云平台适配难度。


容器层创新性地提出容器集群管理器 (CCM),实现电信级容器集群的全生命周期管理,包括:弥补K8S原生方案在账号认证、本地仓库、多集群管理等多方面的短板;统一容器集群编排管理接口,屏蔽异厂商容器集群管理流程差异;支持多模式(独享和共享)、多形态 (虚机、裸机)、多版本(K8S、运行时多版本)等集群管理能力。提出电信级容器网络4项创新技术点,包括:满足电信业务按不同流量类型划分逻辑平面的强隔离要求;主机型/直通型/路由型/交换型四种插件,灵活适配网络和性能要求;本地实例化的服务入口负载均衡器引导入向流量,补充原生能力短板;租户网络、多种网络插件均可使用网络策略,实现网络安全定制化。


MANO创新定义基于DPU智能网卡的容器自动化编排运维管理流程、接口和数据模型要求,实现容器集群、容器应用和配套网络服务一键式开通和极简上线;DPU、硬件资源、虚拟资源、容器资源、容器应用、容器集群等多层资源的可管、可控、可维,降低运维复杂度;容器应用包标准化管理。


06移动Labs

目前,该方案已在河北、浙江进行了端到端试点和规模商用,在商用实践过程中,获得了什么样的实际效果?

班有容

中国移动NFV基于DPU智能网卡的云原生技术方案,已面向数据采集平台、核心网工作台、IP运维工作台等网管业务以及网络边缘云的上云业务全面展开商用部署,实现硬件层、虚拟层、容器层、MANO以及上层业务的全领域覆盖,验证了基于DPU的容器化技术路线作为网络云演进方向的可行性。


该方案已在河北、浙江共2个站点的网管资源池引入,初期建设规模600台服务器,满足各类网管系统上云需求。同时通过网络边缘云三期工程在31省/市全面引入,支撑边缘云节点建设,满足第三方用户上云需求。该技术方案将逐步扩大覆盖规模,为该技术在业务资源池的引入积累经验。


随着技术方案的逐步商用落地,已在资源利用率、管理效率方面获得了明显收益。资源利用率方面,由于DPU减少云平台CPU资源占用、容器技术减少资源浪费和资源碎片,相比同规格、虚拟化的业务,资源利用率提高10%~15%;管理效率方面,DPU技术配合容器技术使裸金属发放、业务部署、业务扩缩时间由小时级缩短到分钟级,管理运维的灵活性、敏捷性大幅度增强,极大地降低了管理维护难度。


07移动Labs

自2018年以来,中国移动基于NFV/SDN技术构建了全球规模最大的网络云。请您谈谈,运营商网络向云原生演进的思考?未来研究院对于推动DPU、容器平台等领域技术产品成熟、生态繁荣有何规划?

班有容

云原生技术能够显著提高网络管理效率,是中国移动网络云的演进方向之一,但虚拟化技术长期以来为支撑网络平稳运行起到了关键作用,且现在尚未“过时”,目前存量业务绝大部分基于虚拟化技术,向云原生演进并非一蹴而就,必将是个长期的过程,可以考虑先从边缘2B等有敏捷迭代需求场景的新建资源池开始,边探索边完善,逐步推动云原生在电信领域的成熟。未来云原生的主流容器形态必将是裸机容器,而作为DPU云原生基础设施之一,能够为裸机容器提供必要的加速功能和安全隔离性,与裸机容器是天作之合。


DPU当前正在经历着由初期探索向产品能力进一步深化迈进的阶段。中国移动希望发挥链长作用,通过算力网络的需求引导,完成DPU软硬件解耦关键技术攻关和企业技术方案与标准制定,与业界合作伙伴共同推进CCSA标准制定和相关开源社区的技术方案输出,在DPU创新开放实验室形成开放、闭环的产业合作模式,携手促进DPU产业的稳步健康发展。





本期特邀专家班有容

中国移动研究院

网络与IT技术研究所研究员

主要负责智能网卡、DPU关键技术研究及产业推进工作。




专题介绍












《专家说》是移动Labs联合中国移动研究院共同打造的,由研究院专家对通信行业科技热点进行深度解读的系列专题,敬请关注。



  中国移动连续两年在“电信运营商数字战略”标杆分析中排名全球第一


●  “鹏城-中移科创基金”大中小企业融通专项首场宣讲会成功召开


●  中国移动集团级在岗十佳成果推介 | 音视频通信技术在主动呼叫摄像头产品中的应用

继续滑动看下一个

专家说:基于DPU智能网卡的云原生方案,如何提升网络云水平?

移动Labs 移动Labs

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存